46 research outputs found

    A Software Library for Reliable Online-Arithmetic with Rational Numbers

    Get PDF
    An overview of a novel calculation framework for scientific computing in integrable spaces is introduced. This paper discusses some implementation issues adopted for a software library devoted to exact rational online-arithmetic operators for periodic rational operands codified in fractional positional notation

    Molecular phylogenetic analysis: design and implementation of scalable and reliable algorithms and verification of phylogenetic properties

    Get PDF
    El término bioinformática tiene muchas acepciones, una gran parte referentes a la bioinformática molecular: el conjunto de métodos matemáticos, estadísticos y computacionales que tienen como objetivo dar solución a problemas biológicos, haciendo uso exclusivamente de las secuencias de ADN, ARN y proteínas y su información asociada. La filogenética es el área de la bioinformática encargada del estudio de la relación evolutiva entre organismos de la misma o distintas especies. Al igual que sucedía con la definición anterior, los trabajos realizados a lo largo de esta tesis se centran en la filogenética molecular: la rama de la filogenética que analiza las mutaciones hereditarias en secuencias biológicas (principalmente ADN) para establecer dicha relación evolutiva. El resultado de este análisis se plasma en un árbol evolutivo o filogenia. Una filogenia suele representarse como un árbol con raíz, normalmente binario, en el que las hojas simbolizan los organismos existentes actualmente y, la raíz, su ancestro común. Cada nodo interno representa una mutación que ha dado lugar a una división en la clasificación de los descendientes. Las filogenias se construyen mediante procesos de inferencia en base a la información disponible, que pertenece mayoritariamente a organismos existentes hoy en día. La complejidad de este problema se ha visto reflejada en la clasificación de la mayoría de métodos propuestos para su solución como NP-duros [1-3].El caso real de aplicación de esta tesis ha sido el ADN mitocondrial. Este tipo de secuencias biológicas es relevante debido a que tiene un alto índice de mutación, por lo que incluso filogenias de organismos muy cercanos evolutivamente proporcionan datos significativos para la comunidad biológica. Además, varias mutaciones del ADN mitocondrial humano se han relacionado directamente con enfermedad y patogenias, la mayoría mortales en individuos no natos o de corta edad. En la actualidad hay más de 30000 secuencias disponibles de ADN mitocondrial humano, lo que, además de su utilidad científica, ha permitido el análisis de rendimiento de nuestras contribuciones para datos masivos (Big Data). La reciente incorporación de la bioinformática en la categoría Big Data viene respaldada por la mejora de las técnicas de digitalización de secuencias biológicas que sucedió a principios del siglo 21 [4]. Este cambio aumentó drásticamente el número de secuencias disponibles. Por ejemplo, el número de secuencias de ADN mitocondrial humano pasó de duplicarse cada cuatro años, a hacerlo en menos de dos. Por ello, un gran número de métodos y herramientas usados hasta entonces han quedado obsoletos al no ser capaces de procesar eficientemente estos nuevos volúmenes de datos.Este es motivo por el que todas las aportaciones de esta tesis han sido desarrolladas para poder tratar grandes volúmenes de datos. La contribución principal de esta tesis es un framework que permite diseñar y ejecutar automáticamente flujos de trabajo para la inferencia filogenética: PhyloFlow [5-7]. Su creación fue promovida por el hecho de que la mayoría de sistemas de inferencia filogenética existentes tienen un flujo de trabajo fijo y no se pueden modificar ni las herramientas software que los componen ni sus parámetros. Esta decisión puede afectar negativamente a la precisión del resultado si el flujo del sistema o alguno de sus componentes no está adaptado a la información biológica que se va a utilizar como entrada. Por ello, PhyloFlow incorpora un proceso de configuración que permite seleccionar tanto cada uno de los procesos que formarán parte del sistema final, como las herramientas y métodos específicos y sus parámetros. Se han incluido consejos y opciones por defecto durante el proceso de configuración para facilitar su uso, sobre todo a usuarios nóveles. Además, nuestro framework permite la ejecución desatendida de los sistemas filogenéticos generados, tanto en ordenadores de sobremesa como en plataformas hardware (clusters, computación en la nube, etc.). Finalmente, se han evaluado las capacidades de PhyloFlow tanto en la reproducción de sistemas de inferencia filogenética publicados anteriormente como en la creación de sistemas orientados a problemas intensivos como el de inferencia del ADN mitocondrial humano. Los resultados muestran que nuestro framework no solo es capaz de realizar los retos planteados, sino que, en el caso de la replicación de sistemas, la posibilidad de configurar cada elemento que los componen mejora ampliamente su aplicabilidad.Durante la implementación de PhyloFlow descubrimos varias carencias importantes en algunas bibliotecas software actuales que dificultaron la integración y gestión de las herramientas filogenéticas. Por este motivo se decidió crear la primera biblioteca software en Python para estudios de filogenética molecular: MEvoLib [8]. Esta biblioteca ha sido diseñada para proveer una sola interfaz para los conjuntos de herramientas software orientados al mismo proceso, como el multialineamiento o la inferencia de filogenias. MEvoLib incluye además configuraciones por defecto y métodos que hacen uso de conocimiento biológico específico para mejorar su precisión, adaptándose a las necesidades de cada tipo de usuario. Como última característica relevante, se ha incorporado un proceso de conversión de formatos para los ficheros de entrada y salida de cada interfaz, de forma que, si la herramienta seleccionada no soporta dicho formato, este es adaptado automáticamente. Esta propiedad facilita el uso e integración de MEvoLib en scripts y herramientas software.El estudio del caso de aplicación de PhyloFlow al ADN mitocondrial humano ha expuesto los elevados costes tanto computacionales como económicos asociados a la inferencia de grandes filogenias. Por ello, sistemas como PhyloTree [9], que infiere un tipo especial de filogenias de ADN mitocondrial humano, recalculan sus resultados con una frecuencia máxima anual. Sin embargo, como ya hemos comentado anteriormente, las técnicas de secuenciación actuales permiten la incorporación de cientos o incluso miles de secuencias biológicas nuevas cada mes. Este desfase entre productor y consumidor hace que dichas filogenias queden desactualizadas en unos pocos meses. Para solucionar este problema hemos diseñado un nuevo algoritmo que permite la actualización de una filogenia mediante la incorporación iterativa de nuevas secuencias: PHYSER [10]. Además, la propia información evolutiva se utiliza para detectar posibles mutaciones introducidas artificialmente por el proceso de secuenciación, inexistentes en la secuencia original. Las pruebas realizadas con ADN mitocondrial han probado su eficacia y eficiencia, con un coste temporal por secuencia inferior a los 20 segundos.El desarrollo de nuevas herramientas para el análisis de filogenias también ha sido una parte importante de esta tesis. En concreto, se han realizado dos aportaciones principales en este aspecto: PhyloViewer [11] y una herramienta para el análisis de la conservación [12]. PhyloViewer es un visualizador de filogenias extensivas, es decir, filogenias que poseen al menos un millar de hojas. Esta herramienta aporta una novedosa interfaz en la que se muestra el nodo seleccionado y sus nodos hijo, así como toda la información asociada a cada uno de ellos: identificador, secuencia biológica, ... Esta decisión de diseño ha sido orientada a evitar el habitual “borrón” que se produce en la mayoría de herramientas de visualización al mostrar este tipo de filogenias enteras por pantalla. Además, se ha desarrollado en una arquitectura clienteservidor, con lo que el procesamiento de la filogenia se realiza una única vez por parte el servidor. Así, se ha conseguido reducir significativamente los tiempos de carga y acceso por parte del cliente. Por otro lado, la aportación principal de nuestra herramienta para el análisis de la conservación se basa en la paralelización de los métodos clásicos aplicados en este campo, alcanzando speed-ups cercanos al teórico sin pérdida de precisión. Esto ha sido posible gracias a la implementación de dichos métodos desde cero, incorporando la paralelización a nivel de instrucción, en vez de paralelizar implementaciones existentes. Como resultado, nuestra herramienta genera un informe que contiene las conclusiones del análisis de conservación realizado. El usuario puede introducir un umbral de conservación para que el informe destaque solo aquellas posiciones que no lo cumplan. Además, existen dos tipos de informe con distinto nivel de detalle. Ambos se han diseñado para que sean comprensibles y útiles para los usuarios.Finalmente, se ha diseñado e implementado un predictor de mutaciones patógenas en ADN mitocondrial desarollado en máquinas de vectores de soporte (SVM): Mitoclass.1 [13]. Se trata del primer predictor para este tipo de secuencias biológicas. Tanto es así, que ha sido necesario crear el primer repositorio de mutaciones patógenas conocidas, mdmv.1, para poder entrenar y evaluar nuestro predictor. Se ha demostrado que Mitoclass.1 mejora la clasificación de las mutaciones frente a los predictores más conocidos y utilizados, todos ellos orientados al estudio de patogenicidad en ADN nuclear. Este éxito radica en la novedosa combinación de propiedades a evaluar por cada mutación en el proceso de clasificación. Además, otro factor a destacar es el uso de SVM frente a otras alternativas, que han sido probadas y descartadas debido a su menor capacidad de predicción para nuestro caso de aplicación.REFERENCIAS[1] L. Wang and T. Jiang, “On the complexity of multiple sequence alignment,” Journal of computational biology, vol. 1, no. 4, pp. 337–348, 1994.[2] W. H. E. Day, D. S. Johnson, and D. Sankoff, “The Computational Complexity of Inferring Rooted Phylogenies by Parsimony,” Mathematical Biosciences, vol. 81, no. 1, pp. 33–42, 1986.[3] S. Roch, “A short proof that phylogenetic tree reconstruction by maximum likelihood is hard,” IEEE/ACM Transactions on Computational Biology and Bioinformatics (TCBB), vol. 3, no. 1, p. 92, 2006.[4] E. R. Mardis, “The impact of next-generation sequencing technology on genetics,” Trends in genetics, vol. 24, no. 3, pp. 133–141, 2008.[5] J. Álvarez-Jarreta, G. de Miguel Casado, and E. Mayordomo, “PhyloFlow: A Fully Customizable and Automatic Workflow for Phylogeny Estimation,” in ECCB 2014, 2014.[6] J. Álvarez-Jarreta, G. de Miguel Casado, and E. Mayordomo, “PhyloFlow: A Fully Customizable and Automatic Workflow for Phylogenetic Reconstruction,” in IEEE International Conference on Bioinformatics and Biomedicine (BIBM), pp. 1–7, IEEE, 2014.[7] J. Álvarez, R. Blanco, and E. Mayordomo, “Workflows with Model Selection: A Multilocus Approach to Phylogenetic Analysis,” in 5th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2011), vol. 93 of Advances in Intelligent and Soft Computing, pp. 39–47, Springer Berlin Heidelberg, 2011.[8] J. Álvarez-Jarreta and E. Ruiz-Pesini, “MEvoLib v1.0: the First Molecular Evolution Library for Python,” BMC Bioinformatics, vol. 17, no. 436, pp. 1–8, 2016.[9] M. van Oven and M. Kayser, “Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation,” Human Mutation, vol. 30, no. 2, pp. E386–E394, 2009.[10] J. Álvarez-Jarreta, E. Mayordomo, and E. Ruiz-Pesini, “PHYSER: An Algorithm to Detect Sequencing Errors from Phylogenetic Information,” in 6th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2012), pp. 105–112, 2012.[11] J. Álvarez-Jarreta and G. de Miguel Casado, “PhyloViewer: A Phylogenetic Tree Viewer for Extense Phylogenies,” in ECCB 2014, 2014.[12] F. Merino-Casallo, J. Álvarez-Jarreta, and E. Mayordomo, “Conservation in mitochondrial DNA: Parallelized estimation and alignment influence,” in 2015 IEEE International Conference on Bioinformatics and Biomedicine (BIBM 2015), pp. 1434–1440, IEEE, 2015.[13] A. Martín-Navarro, A. Gaudioso-Simón, J. Álvarez-Jarreta, J. Montoya, E. Mayordomo, and E. Ruiz-Pesini, “Machine learning classifier for identification of damaging missense mutations exclusive to human mitochondrial DNA-encoded polypeptides,” BMC Bioinformatics, vol. 18, no. 158, pp. 1–11, 2017.<br /

    Information Search Habits of First Year College Students

    Get PDF
    New technologies have transformed teaching processes and enabled new ways of study and learning. In these activities, it is suspected that the students don't make good use of new available technologies or, in the best case, they are underused. The analysis of this issue with the design of strategies to correct any defects found is the motivation that supports the development of this work and the main purpose of it. Evaluate information search habits used by the student and analyse their deduct synthesis and processing capabilities of the results found. The researchers of this study are university teachers of first year subjects, which allows them to know the information search performances by students

    Desarrollo de un Agente Mediador para la Competición PowerTac 2020

    Get PDF
    Vivimos en una sociedad muy dependiente de la energía, en la que prácticamente para cualquier acción del día a día la utilizamos. Nuestra sociedad se ha tenido que ir adaptando a los distintos cambios que han surgido derivados de la energía; sobre todo a los grandes avances producidos y el nacimiento de las energías renovables, es necesario que nuestra sociedad se adapte a estas energías de manera eficiente. El problema radica en que estas energías no se pueden producir a demanda como es el caso de los combustibles fósiles y, por tanto, seguimos siendo dependientes de las energías no renovables.Debido a estos cambios producidos en el contexto de la energía, surge la idea de Power TAC como una competición para el estudio de la liberalización de los mercados de energía, teniendo en cuenta estas energías renovables y manejándolas de manera sostenible. Aunque para esto, la base técnica tiene que estar basada en una actualización de la infraestructura de la energía eléctrica, convirtiéndola en una red inteligente con componentes que puedan monitorizar el uso de energía en tiempo real y ayudar a los consumidores a administrar mejor su uso de energía.El problema de modelado de un mercado de energías como Power TAC se ha enfocado mediante Sistemas Multi Agente (SMA). Este tipo de paradigma de Inteligencia Artificial Distribuido concuerda perfectamente con la simulación compleja que se requiere en la especificación de la competición. Así, esta competición es una simulación de un mercado liberalizado minorista de energía en una ciudad de tamaño medio, en la que los usuario y productores a pequeña escala pueden elegir sobre un conjunto de agentes o brókeres de energía. Esta simulación encaja con la definición del paradigma de Sistemas Multi Agente, ya que cada agente de un SMA se trata de un sistema computacional ubicado en un determinado entorno, y que es capaz de forma flexible y autónoma de efectuar acciones sobre él para alcanzar sus objetivos [WJ95]. De esta forma, cada agente de la competición constituye en sí un sistema computacional que actúa de manera autónoma tomando decisiones para conseguir obtener el mayor beneficio económico posible, durante un período de simulación determinado en la competición.A partir de lo desarrollado en este trabajo, el alcance del trabajo plantea la participación en la competición de 2020. Aunque el entorno inicial de la competición ha variado poco con respecto al año pasado, es previsible que se produzcan algunos cambios relativos al software de la plataforma de simulación que requieran la adaptación de lo recogido en esta memoria. Adicionalmente, se espera seguir depurando las estrategias finales con posterioridad a la lectura de este Trabajo de Final de Grado de cara al mes de junio de 2020, incorporando nuevas simulaciones con los agentes participantes en las ediciones anteriores que todavía no se han podido probar, al no estar su código fuente disponible todavía. La idea en todo caso es probar estrategias nuevas, o al menos que el conjunto de estrategias incluidas en el agente que se diseñe tenga un perfil distinto al de aquellos agentes que ya han participado en anteriores ediciones.<br /

    Prototipado rápido de minería de texto usando campos conceptuales

    Get PDF
    Hoy en día la mayor parte de la información reside en textos. Existen multitud de formas de extraer información de ellos, algunas manuales como la lectura o un análisis sintáctico de una frase tradicional y, otras automáticas como la aplicación de ciertos algoritmos de minería de texto.Las aplicaciones de minería de textos en el ámbito de la informática son inmensas y de diversos tipos, una de ellas es la clasificación de textos que trata de predecir a qué categoría pertenece un determinado texto. Precisamente este tipo de aplicación, la clasificación de textos, es la que se lleva a la práctica en este trabajo de fin de grado.Por otro lado, un concepto no muy explotado en el ámbito de la informática y empleando el lenguaje castellano es el de campo conceptual que hace referencia a una serie de palabras relacionadas con una idea. Existen diccionarios conceptuales incluso disponibles en la web como Zirano con el que se pueden encontrar de forma sencilla palabras relacionadas con una determinada idea. En este sentido, los campos conceptuales resultan ser una herramienta muy útil para enriquecer la información de un determinado texto.El trabajo se ha centrado en el desarrollo de un sistema de minería de texto basado en campos conceptuales para lo cual se han empleado las técnicas de Aprendizaje SVM y árboles de decisión. La implementación de este sistema de minería se ha llevado a cabo en un entorno de prototipado rápido que ha permitido llevar a cabo el desarrollo de forma más amena que de la forma tradicional empleando solamente un lenguaje de programación.En este trabajo se han desarrollado y evaluado varios prototipos de sistemas, uno de los cuales emplea campos conceptuales que obtiene de Zirano relacionados con ciertos sustantivos (sustantivos comunes) presentes en los textos que se emplean para entrenar los clasificadores basados en SVM y árbol de decisión. La fuente de datos de la que se extraen los textos es Twitter de la que se obtienen tweets de diferentes categorías y de extensión razonablemente uniforme, entre 270 y 280 caracteres.Tras los experimentos realizados, se ha obtenido que el mejor sistema de minería de textos desarrollado con el conjunto de datos que se ha probado ha obtenido un 100% de acierto en la predicción, empleando árbol de decisión, entrenando con un conjunto de 70 tweets y validando con otro conjunto de otros 30 tweets.<br /

    Sistema analizador y recomendador de blogs

    Get PDF
    La gran cantidad de información que puede encontrarse en Internet, la diversidad de contenidos y formatos constituyen un reto para que los usuarios filtren los resultados de los buscadores cuando específicamente requieren información seleccionada de artículos de opinión. En este contexto, se percibe la necesidad de desarrollar herramientas más sofisticadas que faciliten la tarea, de forma que los usuarios no empleen tiempo innecesario en la búsqueda de nuevos contenidos relacionados con sus temas de su interés. De esta necesidad no cubierta nace este proyecto, en el que se propone el desarrollo de un entorno software que facilite la gestión de contenidos en blogs de interés, facilitando la propuesta automática de lecturas, actualizaciones de los contenidos, y almacenamiento para su posterior consulta. Puesto que el idioma elegido para los textos para analizar, catalogar y recomendar es el castellano, el proyecto presenta una naturaleza multidisciplinar, por lo que se abordan los aspectos relacionados con la morfología del castellano. La incorporación de estas características inherentes al idioma permitirá lograr una mayor robustez en los clasificadores para incorporar "invariancia semántica" frente a los mecanismos de composición y derivación que son propios de la lengua castellana. A continuación, se abordará una prospección en las técnicas de aprendizaje y minería de datos para identificar aquellas que mejor se adapten a los criterios morfológico-lingüísticos que se pretenden utilizar para los clasificadores de texto. Seguidamente, se planteará una arquitectura del sistema y se desarrollarán las fases correspondientes de diseño e implementación de un prototipo para el que, finalmente, se evaluarán cuestiones relacionadas con el rendimiento. Finalmente, del análisis de los resultados obtenidos se extraerán las conclusiones y el alcance del proyecto

    Estudio de caracterizadores visuales para la detección de obstaculos en vídeos de ski con cámara subjetiva

    Get PDF
    Este trabajo se centra en el estudio de caracterizadores visuales para la identificación de objetos u obstáculos sencillos en vídeos de ski. Para ello se han utilizado técnicas de aprendizaje para desarrollar un prototipo software que se apoya en un conjunto de prueba creado expresamente para este estudio. A nuestro saber este tipo de técnicas no se habían aplicado antes a este campo, por lo que se ha tenido que crear una base de datos con imágenes tomadas en primera persona. Como resultado del proyecto se ha permitido comprobar que, para determinados caracterizadores, se obtienen buenos resultados llegando incluso al 90\% de precisión en el reconocimiento de las clases de objetos creadas. La memoria aborda un análisis del estado del arte, donde se resumen una serie de dispositivos de motorización de la actividad física (pulseras, smartwatches, la nube de aplicaciones que proporcionan servicios extendidos a éstos dispositivos...). El estado del arte también resume los principales artículos relacionados con este estudio y sobre los cuales se apoya, tanto en las técnicas de visión basadas en caracterizadores visuales como en las de aprendizaje. A continuación se presenta la arquitectura del sistema, con un resumen global, la descripción de los caracterizadores visuales SURF (Speed Up Robust Feature), HOG (Histogram of Oriented Gradients), HOF (Histogram of Optical Flow) y MBH (Motion Boundary Histogram) utilizados. Seguidamente, el prototipo del sistema presenta de una manera estructurada toda la implementación realizada. Finalmente, se mostrarán los resultados con su correspondiente evaluación y la gestión del proyecto con sus conclusiones

    Prototipado rápido de un sistema de ayuda a la toma de decisiones para la gestión de carteras de bolsa

    Get PDF
    El objetivo general del proyecto es desarrollar mediante un entorno de prototipado rápido un sistema de ayuda a la toma de decisiones para la gestión de carteras de bolsa.<br /

    A Computational Model of the Belief System Under the Scope of Social Communication

    Get PDF
    This paper presents an approach to the belief system based on a computational framework in three levels: first, the logic level with the definition of binary local rules, second, the arithmetic level with the definition of recursive functions and finally the behavioural level with the definition of a recursive construction pattern. Social communication is achieved when different beliefs are expressed, modified, propagated and shared through social nets. This approach is useful to mimic the belief system because the defined functions provide different ways to process the same incoming information as well as a means to propagate it. Our model also provides a means to cross different beliefs so, any incoming information can be processed many times by the same or different functions as it occurs is social nets

    Parametrizable Architecture for Function Recursive Evaluation

    Get PDF
    Paper submitted to the XVIII Conference on Design of Circuits and Integrated Systems (DCIS), Ciudad Real, España, 2003.This paper presents a function evaluation method developed under the scope of recursive expression of function convolution. This approach is based on a unique parametrizable formula capable of providing function points by successive iteration. When tackling design level, it also shows suitable for developing architectural schemes capable of dealing with different speed and precision issues. An architecture for reconfigurable FPGA based in serial distributed arithmetic implements the design for fast prototyping. The case of combined trigonometric functions involved in rotation is analyzed under this scope. Compared with others methods, our proposal offers a good balance between speed and precision
    corecore